Ephemeral Agent Sandbox
Ephemeral Agent Sandbox
Definition
Ephemeral Agent Sandbox는 에이전트가 파일을 읽고 쓰며 shell/code를 실행하는 격리된 임시 작업환경이다. 중요한 상태와 비밀키를 샌드박스 자체에 의존하지 않고, 필요 시 외부 하네스나 저장소에서 재수화할 수 있게 설계한다.
Why It Matters
샌드박스는 모델이 실제 작업을 수행하는 공간이지만, 프로덕션에서는 언제든 죽거나 만료될 수 있다. 따라서 샌드박스를 load-bearing state로 만들면 장시간 에이전트 작업의 복구성이 떨어지고 보안 위험도 커진다.
Related Concepts
- [Agent Harness](/notes/30-concepts__Agent Harness/)
- [Agent Memory](/notes/30-concepts__Agent Memory/)
- [Human Approval Boundary](/notes/30-concepts__Human Approval Boundary/)
Source-Backed Claims
- Agents SDK는 Docker, local laptop, E2B, Modal, Cloudflare, Vercel 등 여러 sandbox provider를 first-class로 지원하는 방향을 제시한다. Source: [OpenAI Build Hour - Agents SDK](/notes/10-sources__OpenAI Build Hour - Agents SDK/)
- 샌드박스에 secrets를 직접 두면 prompt injection이나 exfiltration 위험이 커지므로, 하네스/인프라 계층과 분리하는 것이 중요하다. Source: [OpenAI Build Hour - Agents SDK](/notes/10-sources__OpenAI Build Hour - Agents SDK/)
- 파일 기반 장기 작업에서는 대화 히스토리만이 아니라 샌드박스 파일시스템 스냅샷과 재수화가 continuity의 핵심이다. Source: [OpenAI Build Hour - Agents SDK](/notes/10-sources__OpenAI Build Hour - Agents SDK/)
- Container network allowlist나 no-egress 설정은 샌드박스 기반 에이전트의 외부 네트워크 접근을 통제하는 보안 장치다. Source: [OpenAI Build Hour - Agents SDK](/notes/10-sources__OpenAI Build Hour - Agents SDK/)
Examples
- 임시 컨테이너에서 PDF를 처리하고 결과 파일만 반환한 뒤 컨테이너를 폐기한다.
- task tracker 에이전트가 작업 데이터 파일을 수정하고 스냅샷을 저장해 다음 실행에서 이어간다.
Open Questions
- 샌드박스 스냅샷은 전체 파일시스템, 작업 디렉터리, 또는 명시 파일 목록 중 어디까지 저장해야 하는가?
Sources
- [OpenAI Build Hour - Agents SDK](/notes/10-sources__OpenAI Build Hour - Agents SDK/)